AI Documentation Workflow
工作流实质
用户侧看到的是一串很长的 prompt:
1 | 首先使用 skills/hugo-tech-blog-writer/SKILL.md 调研后续问题和相关; |
它真正表达的是一个 文档生产状态机,每个 skill 负责一个稳定边界:
- Hugo 写作入口:
hugo-tech-blog-writer负责文章放在哪里、front matter 怎么写、导言和<!-- more -->如何维护、中文技术文风怎么保持。 - 来源与论文调研:先找一手来源、论文 PDF、官方项目页,再写判断;没有来源的结论要显式标注不确定。
- LLM Wiki 记忆层:重要来源保存到
obsidian-vault/.raw/,结构化理解写入obsidian-vault/wiki/,让后续任务能继承本次调研。 - 正文认知锚点图:
ian-xiaohei-illustrations生成一张能解释核心流程的手绘图,而不是做装饰图。 - 论文图表补充:
paper-figure-supplement只选两张图:一张解释逻辑,一张提供实验或数据证据。 - 图片云端化:
image-cloud-uploader上传最终仓库图,Markdown 引用云端 URL,避免本地路径在站点发布后失效。 - 安装与发布:重复 prompt 固化成 skill;文章、图片、wiki 资料和 skill 通过 git commit/push 留下历史。
LLM Wiki
Karpathy 的 LLM Wiki gist 提出一个很直接的区分:多数 RAG 系统是在问题发生时检索相关片段,再临时综合答案;LLM Wiki 则让 LLM 增量维护一个持久 Markdown wiki,把每次来源、问题和回答都编译进知识库。[^karpathy_llm_wiki]
这套模式有三层:
- Raw sources:原始论文、网页、截图、数据文件,只读保存,是事实来源。
- Wiki layer:LLM 维护的概念页、来源页、实体页、对比页、问题页、索引和日志。
- Schema layer:
AGENTS.md、CLAUDE.md、WIKI.md或 skill,规定目录、front matter、更新规则和维护边界。
对 hugoMinos 来说,这个模式已经有了合适落点:
obsidian-vault/.raw/articles/karpathy-llm-wiki.md保存 Karpathy gist 原文。obsidian-vault/wiki/sources/Karpathy LLM Wiki.md保存结构化来源页。obsidian-vault/wiki/concepts/LLM Wiki.md和AI Documentation Workflow.md保存可复用概念。content/仍然是 Hugo 发布层,不承担草稿知识库职责。
论文背景
RAG 论文提供了这条讨论的技术基线:它把 query encoder、document index 和 generator 组合起来,让生成模型在回答时接入非参数化外部知识。[^rag]
论文主结果也说明:在开放域 QA 上,RAG-Token/RAG-Sequence 相比 DPR 等基线有明显提升。这个结果证明 检索增强生成是有效的,但它没有自动解决跨 session 的整理、链接、矛盾维护和写回问题。
后续论文可以从两个方向理解 LLM Wiki 的价值:
- 长期记忆机制:Generative Agents 使用 memory stream、retrieval、reflection 来支持角色行为的连续性,说明“记忆检索 + 反思更新”是 agent 持续性的核心部件。[^generative_agents]
- 显式内存管理:MemGPT 把 LLM 看成带内存层级的操作系统过程,通过 context、external memory 和控制策略缓解上下文窗口限制。[^memgpt]
- 个人知识库传统:Karpathy 也把 LLM Wiki 追溯到 Vannevar Bush 的 Memex:真正有价值的不是单个文档,而是文档之间可维护的关联路径。[^memex]
融入 Prompt
把原来的长 prompt 改成可复用版本后,应该尽量让任务入口短、边界清楚、可验证:
1 | 使用 $work-with-ai-doc-workflow 完成下面的文档任务。 |
这段 prompt 的重点不是“列更多要求”,而是把工作拆成可以被检查的中间物:
- raw source 是否存在:例如
obsidian-vault/.raw/articles/karpathy-llm-wiki.md。 - wiki 是否更新:概念页、来源页、index/log/hot cache 是否同步。
- 图片是否可追溯:生成图和仓库图 hash 一致,论文裁图注明 Figure/Table 来源。
- Markdown 是否可发布:front matter、导言、图床链接、引用、
git diff --check都通过。 - skill 是否安装:仓库 skill 和本机
~/.codex/skills/是否同步。
安装结果
本次已经把工作流安装到仓库和本机:
1 | repo: |
本机安装选择 symlink,而不是复制一份 skill。原因是 仓库版本是源头:后续修改 skills/work-with-ai-doc-workflow/SKILL.md,本机 Codex 自动看到同一份规则,避免 repo 和电脑出现两个分叉版本。
后续问题
这条链路还需要继续演化,尤其是四个方向:
- wiki lint 怎么做:当
obsidian-vault/wiki/页面变多后,需要定期检查孤立页、过期结论、缺失来源和重复概念。 - 什么时候写回 wiki:不是每个回答都值得入库。适合写回的是可复用判断、来源摘要、概念框架、对比结论和调研路径。
- 图表选择标准:论文证据图应该优先选择主 benchmark、核心 ablation 或最能支撑文章论点的数据表;不要用生成图冒充实验结果。
- 是否接入本地搜索:Karpathy 提到
qmd这类 Markdown 搜索工具适合 wiki 规模变大后使用;当前index.md + rg足够,后续再安装更稳。
总结
这次改造后,我的文档工作流从“长 prompt 驱动”变成了“skill + wiki + Hugo + 图床 + git 驱动”。它的好处是每一步都有可检查产物:
- 资料被保存,而不是只在模型上下文里出现;
- 判断被写入 wiki,而不是散落在聊天记录里;
- 图片有仓库源文件和云端 URL;
- 论文图表有 Figure/Table 来源;
- 重复 prompt 被安装成 skill;
- 文章通过 git 历史进入长期维护。
最终目标不是让 AI 一次写完文章,而是让每次写作都给下一次写作留下更好的地基。
参考文献
[^karpathy_llm_wiki]: Andrej Karpathy, LLM Wiki.
[^rag]: Patrick Lewis et al., Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks, NeurIPS 2020.
[^generative_agents]: Joon Sung Park et al., Generative Agents: Interactive Simulacra of Human Behavior, UIST 2023.
[^memgpt]: Charles Packer et al., MemGPT: Towards LLMs as Operating Systems, arXiv 2023.
[^memex]: Vannevar Bush, As We May Think, The Atlantic, 1945.
AI Documentation Workflow
http://icarus.shaojiemike.top/2026/07/01/Work/0-Digital Worker/WorkWithAIDocWorkflow/